Biblioteki, stałe i ładowanie danych¶

Wstępna eksploracja¶

title danceability energy key loudness mode speechiness acousticness instrumentalness liveness valence tempo duration_ms time_signature genres
id
3JHpk0DOTOzyh0777JFAky Diosa 0.801 0.745 6.0 -3.733 0.0 0.0630 0.3980 0.006030 0.1530 0.245 104.965 214013.0 4.0 [latin, reggaeton, trap latino]
61qYXh7HvnjjT1GfTzo9Ld Amen 0.835 0.644 7.0 -6.175 1.0 0.1490 0.1130 0.000002 0.1010 0.410 120.007 364009.0 4.0 [kasi rap, south african hip hop, south africa...
6y8fHHwkvcmXKpxCB34y68 Henkilökohtaisesti (Vain elämää kausi 8) 0.659 0.641 0.0 -6.435 1.0 0.0240 0.0857 0.000000 0.1490 0.769 101.951 180773.0 4.0 [finnish hip hop, finnish pop, suomi rock, isk...
3jipFRgLyKK0oJoG1pKicx Jaded 0.766 0.272 0.0 -5.696 1.0 0.0410 0.0366 0.000000 0.1750 0.037 116.036 262453.0 4.0 [toronto rap, hip hop, canadian hip hop, canad...
6Y3hqLC16tJUEI4PDsusoT 3ach9ek Criminel 0.593 0.637 10.0 -8.613 0.0 0.0899 0.1150 0.000000 0.0971 0.370 77.550 172000.0 4.0 [rai]
Wymiary zbioru danych: (84121, 15)
Liczba wszystkich dostępnych miejsc w top listach: 3447400

Wstępnie można zaobserwować występowanie tych samych utworów w ramach wielu rankingów.

country_code
ae    172
ar    270
at    271
au    271
be    271
     ... 
ua     86
us    271
uy    271
vn    208
za    208
Length: 71, dtype: int64

Informacje o rankingach są niepełne dla takich państw jak Białoruś (3), Indie (158), Emiraty Arabskie (172), Egipt (172) oraz Izrael (208).

Cechy audio nie są skorelowane (zauważalna korelacja jedynie dla energy i loudness), charakteryzują się różnymi rozkładami.

PCA¶

Poszczególne komponenty zachowują względnie dużo informacji - zbiór jest złożony.

Attribute, PC1, PC2
danceability : -0.287545486853366 : -0.5322226673501348
energy : -0.5397851966230109 : 0.23307996649226898
loudness : -0.4995485450231023 : 0.28658486209455053
speechiness : -0.10274315482961499 : -0.4796018811074988
acousticness : 0.41426184801556226 : -0.07626269897984653
instrumentalness : 0.1937099764238037 : -0.029055640511998663
liveness : -0.09925021763026812 : 0.21939739845819928
valence : -0.3565092517226398 : -0.2066619435854209
tempo : -0.0705453508190999 : 0.10900488748357091
duration_ms : 0.12158164879953826 : 0.4907924629227487

Wartości elementów są stosunkowo duże dla wszystkich cech, oprócz cechy tempo.

Przestrzeń jest rozciągana głównie przez to, jak utwory są głośne i energiczne oraz jak bardzo są akustyczne.

Zmienność cech w czasie¶

Obserwacje:

  1. Sezonowość (Boże Narodzenie):
  • coroczny spadek natężenia taneczności, energii, głośności i niewokalności utworów przed Świętami Bożego Narodzenia (i szybki wzrost przed nowym rokiem), wzrost natężenia akustyczności i pogodności utworów.
  1. Trendy:
  • spadek taneczności utworów (prawdopodobnie w związku z pandemią);
  • spadek stosunku mowy do muzyki (prawdopodobnie z powodu wzrostu popularności podcastów i powstania dedykowanych serwisów);
  • wzrost pogodności utworów od początku pandemii;
  • spadek średniej długość utworów na przestrzeni ostatnich lat;
  • wzrost akustyczności utworów na przestrzeni ostatnich lat.